周志华的同名书籍的阅读笔记,入门读物
第一章 绪论
1.1 引言
1.2 基本术语
classification:预测结果是离散值(好瓜、坏瓜)
regression:预测结果是连续值(成熟度0.95 0.37)
binary classification:只涉及两个结果的分类,通常称之为一个为positive class 一个为 negative class
multi-class classification:多分类
预测任务是希望通过训练对训练集{(x1,y1),(x2,y2)…(xm,ym)}进行学习,建议一个从输入空间X到输出空间Y的映射,对于二分类任务,通常另Y = {-1,1}或者{0,1},对多分类任务,|Y|>2,回归任务,Y = R,R是实数集。
学习完毕模型后,使用其预测的过程叫做测试(testing),被预测的样本称为“测试样本”(testing sample),例如在学得f之后,对测视例x,可得到其预测目标y = f(x).
聚类(clustering),即将训练集中的西瓜分为若干组(cluster),在聚类学习中,分的类我们是事先不知道的,学习过程中使用的训练样本通常不配拥有标记信息。
根据训练数据是否用哦与标记信息,学习任务大致可以划分为两大类:“监督学习(supervised learning)和非监督学习(unsupervised learning),分类和回归是前者的代表,聚类是后者的代表”